package util;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*工具类，作用是把传入的字符串的标点符号等非中英文字符、数字字符的其他字符都去掉*/

public class FilterPunctuation {

	public String filter(String s) {

		Pattern p = Pattern.compile("(\\w)|[\u4E00-\u9FA5]");
		Matcher m = p.matcher(s);
		String word = "";
		//为简单每次只拿出一个字符
		while (m.find()) {
			//s1就是每次拿出的一个字符
			String s1 = s.substring(m.start(), m.end());
			//每次拿出的字符加到word字符串里
			word = word + s1;
		}

		return word;

	}

}
